به کارگیریِ اطلاعاتِ زبانی در یک سیستمِ بازشناسیِ گفتار پیوستة فارسی

Authors

محمد بحرانی

حسین صامتی

abstract

در این مقاله یک سامانۀ بازشناسی گفتار پیوسته برای زبان فارسی معرفی می شود و نقش مدل آوایی و مدل زبانی در آن مورد بررسی قرار می گیرد. مدل های آوایی با روش های مستقل از بافت و وابسته به بافت در این سامانه به کار رفته و نتایجِ به کارگیریِ آن ها ارائه شده است. مدل زبانیِ سه کلمه ای نیز با روش های مبتنی بر کلمه، مبتنی بر مقولة نحوی و مبتنی بر طبقه، با استفاده از پیکرۀ متنیِ زبانِ فارسی استخراج و در سامانۀ بازشناسی به کار گرفته شده است. همچنین مدل زبانیِ دستوری مبتنی بر دستور ساخت- گروهیِ تعمیم یافته در این سامانه پیاده سازی شده و نیز در ترکیب با مدل زبانیِ آماری به کار رفته است.  نتایج حاصل نشان می دهد که مدل آواییِ وابسته به بافت، مطابق انتظار، بهترین عملکرد را دارد. همچنین مدلِ زبانیِ سه کلمه ایِ مبتنی بر کلمه، نسبت به سایر روش های استخراجِ مدلِ زبانیِ آماری برتری دارد. درضمن ترکیب مدلِ زبانیِ دستوری با مدلِ زبانیِ آماری منجر به بهبود نتایجِ بازشناسی می شود. سامانۀ بازشناسیِ گفتارِ معرفی شده در این مقاله، اولین سامانۀ بازشناسی برای گفتارِ پیوستة فارسی بوده و با پشتوانۀ فعالیت های تحقیقاتیِ متعددی که برای پیاده سازیِ آن انجام شده است، قابلیت استفاده به صورت کاربردی را یافته است.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

به‌کارگیریِ اطلاعاتِ زبانی در یک سیستمِ بازشناسیِ گفتار پیوستة فارسی

در این مقاله یک سامانۀ بازشناسی گفتار پیوسته برای زبان فارسی معرفی می‌شود و نقش مدل آوایی و مدل زبانی در آن مورد بررسی قرار می‌گیرد. مدل‌های آوایی با روش‌های مستقل‌از‌بافت و وابسته‌به‌بافت در این سامانه به‌کار رفته و نتایجِ به‌کارگیریِ آن‌ها ارائه شده است. مدل زبانیِ سه‌کلمه‌ای نیز با روش‌های مبتنی‌بر کلمه، مبتنی‌بر مقولة نحوی و مبتنی‌بر طبقه، با استفاده از پیکرۀ متنیِ زبانِ فارسی استخراج و در سامان...

full text

پایه‌گذاری بستری نو و کارآمد در حوزه بازشناسی گفتار فارسی

Although researches in the field of Persian speech recognition  claim  a  thirty-year-old  history in Iran  which has achieved considerable progresses, due to the lack of well-defined experimental framework, outcomes from many of these researches are not comparable to each other and their accurate assessment won’t be possible. The experimental framework includes ASR toolkit and speech database ...

full text

رتبه‌بندی واج‌های گفتار فارسی از نظر کارآیی در بازشناسی گوینده

در این مقاله، کارآیی واج­های گفتار فارسی از نظر بازشناسی گوینده مورد مطالعه و پژوهش قرار گرفته و با توجه به میزان کارآیی­ها، رتبه­بندی واج­ها صورت گرفته‌اند. جهت برآورد کارآیی واج­ها، از یک معیاری که به­صورت نسب « فاصلة بین­گوینده­ای» واج­ها به « فاصلة در گوینده‌ای» تعریف شده است و ما آن را « نسبت تأثیرپذیری گوینده » نامیده­ایم، استفاده شده است.­ آزمایش­ها و محاسبات لازم برای کلیه واج­های گفتار...

full text

بازشناسی گفتار احساسی و شناسایی حالت گفتار در زبان فارسی

حالت گفتار سبب افزودن اطلاعات اضافی نسبت به اطلاعات نوشتاری می شود. از طرف دیگر، وجود حالت در گفتار سبب بروز مشکل در فرایند بازشناسی گفتار می شود. در تحقیقات قبلی نشان داده شد که حالت گفتار سبب تغییرات اساسی در پارامترهای گفتاری می شود. برای بهبود نتایج بازشناسی گفتار با حالت، ابتدا باید تأثیر آن را بر پارامترهای گفتاری به دست آورد و در مرحله بعدی، از پارامترهای مناسبی برای بهبود نتایج بازشناسی...

full text

به کارگیریِ اطلاعاتِ زبانی در یک سیستمِ بازشناسیِ گفتار پیوسته فارسی

در این مقاله یک سامانۀ بازشناسی گفتار پیوسته برای زبان فارسی معرفی می شود و نقش مدل آوایی و مدل زبانی در آن مورد بررسی قرار می گیرد. مدل های آوایی با روش های مستقل از بافت و وابسته به بافت در این سامانه به کار رفته و نتایجِ به کارگیریِ آن ها ارائه شده است. مدل زبانیِ سه کلمه ای نیز با روش های مبتنی بر کلمه، مبتنی بر مقوله نحوی و مبتنی بر طبقه، با استفاده از پیکرۀ متنیِ زبانِ فارسی استخراج و در سامان...

full text

ارائه یک روش جدید بازیابی اطلاعات مناسب برای متون حاصل از بازشناسی گفتار

In this article a pre-processing method is introduced which is applicable in speech recognized texts retrieval task. We have a text corpus, t generated from a speech recognition system and a query as inputs,  to search queries in these documents and find relevant documents. A basic problem in a typical speech recognized text is some error percentage in recognition. This, results erroneously ass...

full text

My Resources

Save resource for easier access later


Journal title:
زبان و زبان شناسی

Publisher: انجمن زبان شناسی ایران

ISSN

volume 6

issue 11 2010

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023